39 research outputs found

    From Data Topology to a Modular Classifier

    Full text link
    This article describes an approach to designing a distributed and modular neural classifier. This approach introduces a new hierarchical clustering that enables one to determine reliable regions in the representation space by exploiting supervised information. A multilayer perceptron is then associated with each of these detected clusters and charged with recognizing elements of the associated cluster while rejecting all others. The obtained global classifier is comprised of a set of cooperating neural networks and completed by a K-nearest neighbor classifier charged with treating elements rejected by all the neural networks. Experimental results for the handwritten digit recognition problem and comparison with neural and statistical nonmodular classifiers are given

    Reconnaissance de formes en multi-orientation et multi-echelle sur documents techniques

    Get PDF
    Nous considérons le problème de la reconnaissance de formes en imagerie dans le cas où les structures à reconnaître sont disponibles dans une orientation et à un facteur d'échelle quelconques. Plus précisément, nous décrivons un outil mis au point pour la rétroconversion automatique de documents techniques, archivés sous forme « papier », du réseau téléphonique géré par France Télécom. La technique employée, qui s'appuie sur la transformée de Fourier-Mellin (TFM), est mise en oeuvre sous la forme d'un banc de filtres 2-D. Deux phases de reconnaissance sont proposées. La première s'adresse à des symboles et caractères préalablement identifiés comme isolés. La seconde phase permet la reconnaissance de formes superposées. Dans les deux modes de fonctionnement, un jeu de descripteurs invariants par similitude est calculé et appliqué à un classifieur K-PPV. Nous présentons des résultats de classification sur une base importante de symboles et de caractères, qui mettent en évidence la supériorité de notre approche sur celle des moments de Zernike

    Identification et analyse de textes arabes par approche affixale

    No full text
    Les travaux présentés dans ce mémoire abordent les problèmes liés à la différenciation et la reconnaissance de textes en mode hors-ligne dans des documents multilingues arabe et latin. La première partie de ces travaux concerne une méthode de différenciation entre les textes arabes et les textes latins dans les deux natures imprimée et manuscrite. La deuxième partie propose une nouvelle approche, appelée approche affixale, pour la reconnaissance de mots et l'analyse de textes arabes. Cette approche se distingue par la modélisation d'entités morphosyntaxiques (morphèmes de base du mot) en intégrant les aspects morpho-phonologiques du vocabulaire arabe dans le processus de reconnaissance par rapport aux approches classiques qui procèdent par la modélisation d'entités graphiques (mot, lettre, pseudo mot). Les tests réalisés montrent bien l'apport de l'approche au niveau de la simplification de la reconnaissance et la caractérisation morphosyntaxique des mots dans un texte arabe.The presented work in this memory tackles the problems involved in differentiation and text recognition in off-line mode in Arabic and Latin multilingual documents. The first part of this work relates to a method of differentiation between Arabic texts and Latin texts in two natures printed and handwritten. The second part proposes a new approach, called affixal approach, for Arabic word recognition and text analysis. This approach is characterized by modelling from morph-syntactic entities (word basic morphemes) by integrating the morpho-phonological aspects of Arabic vocabulary in the recognition process compared to the traditional approaches which proceed by the modelling of grahic entities (word, letter, pseudo word). The tests carried out show well the contribution of the approach on the recognition simplification and the morph-syntactic categorization of the words in an Arabic text.ROUEN-BU Sciences (764512102) / SudocROUEN-BU Sciences Madrillet (765752101) / SudocTOURS-Polytech'Informat.Product. (372612209) / SudocSudocFranceF

    Filtrage et compression de données issues d'une table à digitaliser

    No full text
    Nous proposons un prétraitement de l'information issue d'une table à digitaliser qui permet à la fois d'éliminer les bruits d'acquisition et de polygonaliser le tracé. Le principe général de l'approximation du tracé est basé sur la définition d'un ensemble de segments de droites définies par double moindres carrés. La mise en place de tests sur des figures géométriques et sur le tracé de l'écriture cursive confirme la cohérence de la démarche

    Contribution à l'évaluation des méthodes de combinaison parallèle de classifieurs par simulation

    No full text
    Les travaux de recherche présentés dans ce mémoire abordent le probleme de la simulation de classifieur pour l'évaluation du comportement des méthodes de combinaison parallèle de classifieurs. Nous proposons une méthode originale de simulation permettant de générer des sorties artificielles d'un classifieur (listes de propositions) pour un problème de classification quelconque. Le principe de cette simulation est basé sur le contrôle de matrices de performances(globales, semi-globales ou locales) permettant de décrire le comportement désiré du classifieur pour générer la liste de ses sorties. Nous proposons également une méthode de simulation de classifieurs corrélés permettant, à partir des performances désirées et en fonction d'un niveau de diversité fixé, de générer artificiellement des sorties corrélées. Les tests réalisés sur quelques règles simples de combinaison montrent l'intérêt de l'approche de simulation proposée dans l'étude du comportement des méthodes de combinaison.This thesis deals with the problem of classifier simulation for evaluating the behaviour of classifier combination methods. We propose an original method of simulation to generate artificial classifier outputs (list of solutions) for a given classification problem. This method is based on the control of performance matrices (global, intermediate or local) allowing to describe the desired behaviour of the classifier in order to generate the list of its outputs. We also propose a method for simulating correlated classifiers, which allows, from desired performance and a fixed level of diversity, to generate artificially correlated outputs. Tests carried out on a few simple combination rules show the interest of the proposed approach for the study of the combination method behaviour.ROUEN-BU Sciences (764512102) / SudocROUEN-BU Sciences Madrillet (765752101) / SudocSudocFranceF

    Apprentissage par renforcement pour la recherche d'information interactive

    No full text
    National audienceLa recherche d'information dans de grands ensembles documentaires est parfois considérée aujourd'hui comme un sujet de recherche en partie résolu. Or, si les moteurs de recherche actuels résolvent bien la problématique de base d'accès aux documents, il est clair qu'il existe encore de nombreux cas particuliers de recherche où les outils courants ne sont pas suffisants. Pour cela, de nouvelles approches voient le jour dans le domaine de la recherche d'information interactive. La notion d'interactivité consiste à replacer l'utilisateur au coeur du système. Cela nécessite la mise en place de systèmes dynamiques capables d'adapter les réponses mises à la disposition de l'utilisateur. Dans cette optique, cet article présente un système (et son expérimentation) mettant en jeu un apprentissage par renforcement pour la sélection d'outils de support à la recherche, et reposant sur une analyse fine des interactions et des comportements de l'utilisateur

    Une méthodologie pour la rétroconversion des documents papier vers un format electronique

    No full text
    International audienceThis paper presents a method to convert paper documents in an electronic format. This method consists in the definition of a convenient electronic format associated with a strategy for document understanding. The proposed representation of the document describes different abstraction levels. It is adapted to respond to many problems in the document processing domain. A strategy for document understanding is developed. It uses the proposed document representation and is based on extraction and identification of document entities, on the study of the consistency of the description and on the treatment of inconsistencies. Finally, future prospects are presented to implant this strategy in a document understanding system.Cet article présente une méthodologie pour la rétroconversion des documents papier vers un format électronique. Cette méthodologie se caractérise par une modélisation objet des documents couplée à une stratégie d'interprétation. La représentation proposée tente de répondre aux besoins d'un grand nombre d'applications dans le domaine du traitement des documents. En particulier, elle paraît adaptée à l'analyse et a l'interprétation des documents. Nous présentons également une stratégie d'interprétation des documents, associée à cette modélisation. Cette stratégie est basée sur l'extraction et l'identification des eléments du document, l'étude de la cohérence de la description globale du document et la remise en cause des traitements conduisant a des incohérences. Enfin, nous présentons des perspectives en terme d'implantation au sein d'un système d'interprétation de document

    A Strategy for Retrospective Conversion of Documents

    No full text
    International audienceThis paper proposes a strategy for retrospective conversion of documents. This strategy consists in an interpretation cycle where document analysis and document understanding interact. This cycle is initialized by the extraction of the outline of the layout and logical structures of the document. Then, each iteration of the cycle consists in the detection of inconsistencies in the document modeling. Treatment are applied to correct these inconsistencies. The cycle ends when no more inconsistency occurs. The method used for document objects classification is based on the fusion of statistical and structural clas-sifier results. A structural comparison method is used for document structure classification. The different levels of inconsistency which may occur in the document representation are detailed. Several treatments to solve theses inconsistencies are presented. Finally, future prospects concerning incremental learning of new classes of documents are developped in order to implant this strategy in a document processing system
    corecore